IA023
Introducción a la programación con Triton
Implementando tu primer kernel: Suma de vectores
Objetivos de aprendizaje
- Identificar los componentes principales de un kernel de CUDA usando el especificador __global__
- Implementar la asignación de memoria en dispositivo y la transferencia de datos entre el host y el dispositivo
- Calcular los índices de hilos globales para mapear elementos de datos a hilos individuales de la GPU
- Ejecutar y sincronizar el lanzamiento de un kernel paralelo utilizando configuraciones de rejilla y bloques